Los datos diabetes-data.csv contienen la información de medición de glucosa en la sangre de 70 pacientes con diabetes observados en diferentes momentos del tiempo (horas, días, semanas, meses).
El contenido y formato de los datos es el siguiente:
Los datos de concentración en la sangre se obtienen de dos fuentes:
Las mediciones eletrónicas automáticas se obtienen con etiquetas de tiempo específicas, mientras que las mediciones obtenidas de los registros escritos corresponden a horarios ficticios con la siguiente relación: Desayuno (08:00), comida (12:00), cena (18:00), y hora de dormir (22:00).
El campo code corresponde al tipo de insulina administrada al paciente.
Nota: La información de la adminitración de insulina, en este momento, es irrelevante.
date time code value
Length:29264 Length:29264 Min. : 4.0 Min. : 0.00
Class :character Class1:hms 1st Qu.:33.0 1st Qu.: 6.00
Mode :character Class2:difftime Median :48.0 Median : 24.00
Mode :numeric Mean :46.5 Mean : 79.42
3rd Qu.:60.0 3rd Qu.:142.00
Max. :72.0 Max. :501.00
NA's :8
individual atributo
Min. : 1.00 Length:29264
1st Qu.:21.00 Class :character
Median :34.00 Mode :character
Mean :36.45
3rd Qu.:55.00
Max. :70.00
Observations: 29,264
Variables: 6
$ date <chr> "04-21-1991", "04-21-1991", "04-21-1991", "04-21-19...
$ time <time> 09:09:00, 09:09:00, 09:09:00, 17:08:00, 17:08:00, ...
$ code <int> 58, 33, 34, 62, 33, 48, 58, 33, 34, 33, 62, 33, 58,...
$ value <dbl> 100, 9, 13, 119, 7, 123, 216, 10, 13, 2, 211, 7, 25...
$ individual <int> 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, ...
$ atributo <chr> "medición de glucosa en sangre antes del desayuno",...
4 horas en las que se miden se refiere a los registros realizados antes del desayuno (08:00), comida (12:00), cena (18:00), y hora de dormir (22:00).outliers. También el primer, segundo y tercer cuartil son más bajos en relación al resto de las mediciones.Existen individuos muy por debajo de la media global y también por arriba. Incluso, hay algunos que estan por encima del tercer cuartil.
outliers y nuestro rango de datos tiene una gran variabilidad desde 50.04hasta 121.67.Existe discrepancia entre individuos aunque hay algunos
similares entre ellos.
Sí, son más bajas:
33,34,35,36 corresponden a administración de insulina medicada, por lo que ayuda a disminuir el nivel de glucosa en la sangre, por dicha razón estos códigos se asocian con niveles bajos de glucosa.Para esta pregunta se realizó un modelo jeráquico, la jerarquía se aplica a nivel individuo en donde los individuos comparten la precisión. Esto nos permite mejorar la precisión de las estimaciones de los parámetros para los que no se tienen suficientes observaciones. Por ejemplo, en este caso tenemos individuos con menos días observados.
En este primer modelo no se busca predecir el nivel de glucosa sino verificar si existe una diferencia clara entre los días que se ingieren más alimentos de lo usual.
Se crea una base con el promedio diario de glucosa con un indicador que especifica si en ese día el paciente ingirió más alimentos de lo normal.
Compiling model graph
Resolving undeclared variables
Allocating nodes
Graph information:
Observed stochastic nodes: 3853
Unobserved stochastic nodes: 7779
Total graph size: 23408
Initializing model
En esta gráfica se observa que hay una discrepancia clara entre los días que ingieren más alimentos de lo usal. \(Beta1\) es negativa y representa a los días que se consumió una cantidad normal de alimentos y \(Beta2\) es positiva lo cual significa que el nivel de glucosa aumenta si se come más de lo normal.
Se grafica el parámetro \(alpha\) para observar si existe alguna diferencia entre individuos. Observamos que se comportan de manera similar. (Los intervalos se empalman)
mean 2.5% 97.5%
beta.adj[1] -0.03343809 -0.04637457 -0.02077302
beta.adj[2] 0.03343809 0.02077302 0.04637457
[1] 41341.46
[1] 0.2599973
[1] 38795.73
Queremos predecir la medición promedio de glucosa para un individuo cuando come una cantidad de alimentos normal o cuando se excede.
Para plantear este modelo, construimos una base con el promedio de las mediciones por individuo, separando por el tipo de consumo.
En exploratorio de los datos vimos que la mediana del nivel de gluscosa es mayor cuando se excede de la cantidad de alimentos habitual.
Compiling model graph
Resolving undeclared variables
Allocating nodes
Graph information:
Observed stochastic nodes: 104
Unobserved stochastic nodes: 281
Total graph size: 914
Initializing model
En la gráfica de ajustados vs osbservados se aprecia que los puntos están alrededor de una linea de 45º. Podemos ver que sobreestimamos mediciones pequeñas y subestimas mediciones grandes.
Los datos observados se encuentran dentro de nuestros intervalos de confianza.
Observamos que las betas indican una discrepancia entre la diferencia de la ingesta de alimentos, pero no es tan discrminante como el modelo anterior. Esto se puede deber a que estamos promediando individuos y no individuos-días.
Se grafica el parámetro \(alpha\) para observar si existe alguna diferencia entre individuos. Observamos que se comportan de forma similar. Sin embargo, en este caso hay alphas cuyos intervalos no se interceptan, entonces estos individuos sí tienen comportamiento distinto en sus mediciones de glucosa.
En este modelo se obtiene un mejor DIC y \(R^2\).
mean 2.5% 97.5%
beta.adj[1] -0.04094879 -0.07072841 -0.01101044
beta.adj[2] 0.04094879 0.01101044 0.07072841
[1] 1013.093
Error in cor(base_ingesta$medicion, out.yf[, 1]): 'x' must be numeric
[1] 0.2599973
[1] 913.7663